Este módulo introdutório pontua o abismo entre matrizes de caracteres brutas e não estruturadas e a rigidez matemática de teoria da linguagem formal. Passamos de busca imperativa—inspeção manual caractere por caractere—para especificação declarativa, onde definimos uma gramática formal que representa o conjunto infinito de strings válidas.
1. A Natureza da Entropia das Strings
Dados brutos são intrinsecamente "desorganizados" porque carecem de estrutura; são meramente uma sequência de bytes até que uma gramática formal categorize seus constituintes. No design de protocolos, validar essa entropia é a primeira linha de defesa contra entradas malformadas.
2. Paradigmas & Autômatos
A expressão regular tem raízes na Hierarquia de Chomsky. Expressões regulares servem como plantas para construir Autômatos Finitos Determinísticos (AFD). Em vez de escrever if-else cadeias para encontrar padrões, definimos o que o padrão é, permitindo que o motor trate a lógica de navegação.